Markov decision processes with restricted observations: Finite horizon case

Naval Research Logistics (NRL) ◽

10.1002/(sici)1520-6750(199708)44:5<439::aid-nav3>3.0.co;2-5 ◽

1997 ◽

Vol 44 (5) ◽

pp. 439-456 ◽

Author(s):

Yasemin Serin ◽

Zeynep Muge Avsar

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Finite Horizon ◽

Markov Decision ◽

Download Full-text

A nonlinear programming model for partially observable Markov decision processes: Finite horizon case

European Journal of Operational Research ◽

10.1016/0377-2217(94)00091-p ◽

1995 ◽

Vol 86 (3) ◽

pp. 549-564 ◽

Author(s):

Yasemin Serin

Keyword(s):

Nonlinear Programming ◽

Markov Decision Processes ◽

Programming Model ◽

Decision Processes ◽

Finite Horizon ◽

Markov Decision ◽

Nonlinear Programming Model ◽

Partially Observable Markov ◽

Partially Observable ◽

Download Full-text

Finite-horizon piecewise deterministic Markov decision processes with unbounded transition rates

Stochastics ◽

10.1080/17442508.2018.1518450 ◽

2018 ◽

Vol 91 (1) ◽

pp. 67-95 ◽

Author(s):

Yonghui Huang ◽

Xianping Guo

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Finite Horizon ◽

Transition Rates ◽

Unbounded Transition Rates ◽

Markov Decision

Download Full-text

An Approximate Stochastic Annealing algorithm for finite horizon Markov decision processes

49th IEEE Conference on Decision and Control (CDC) ◽

10.1109/cdc.2010.5717689 ◽

2010 ◽

Author(s):

Jiaqiao Hu ◽

Hyeong Soo Chang

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Finite Horizon ◽

Markov Decision ◽

Annealing Algorithm

Download Full-text

A Corrected And Improved Computational Scheme For Finite Horizon Partially Observable Markov Decision Processes

INFOR Information Systems and Operational Research ◽

10.1080/03155986.1991.11732169 ◽

1991 ◽

Vol 29 (3) ◽

pp. 206-212

Author(s):

Sraban Mukherjee ◽

Kiran Seth

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Finite Horizon ◽

Computational Scheme ◽

Markov Decision ◽

Partially Observable Markov ◽

Partially Observable

Download Full-text

Convergence of Value Functions for Finite Horizon Markov Decision Processes with Constraints

Applied Mathematics & Optimization ◽

10.1007/s00245-020-09707-x ◽

2020 ◽

Author(s):

Naoyuki Ichihara

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Finite Horizon ◽

Value Functions ◽

Markov Decision

Download Full-text

Successive Approximations for Finite Horizon, Semi-Markov Decision Processes with Application to Asset Liquidation

Operations Research ◽

10.1287/opre.34.4.638 ◽

1986 ◽

Vol 34 (4) ◽

pp. 638-644 ◽

Author(s):

John W. Mamer

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Finite Horizon ◽

Successive Approximations ◽

Markov Decision

Download Full-text

Lexicographic refinements in possibilistic decision trees and finite-horizon Markov decision processes

Fuzzy Sets and Systems ◽

10.1016/j.fss.2018.02.006 ◽

2019 ◽

Vol 366 ◽

pp. 85-109

Author(s):

Nahla Ben Amor ◽

Zeineb El Khalfi ◽

Hélène Fargier ◽

Régis Sabbadin

Keyword(s):

Decision Trees ◽

Markov Decision Processes ◽

Decision Processes ◽

Finite Horizon ◽

Markov Decision

Download Full-text

Functional Reward Markov Decision Processes: Theory and Applications

International Journal of Artificial Intelligence Tools ◽

10.1142/s0218213017600144 ◽

2017 ◽

Vol 26 (03) ◽

pp. 1760014

Author(s):

Paul Weng ◽

Olivier Spanjaard

Keyword(s):

Markov Decision Processes ◽

Infinite Horizon ◽

Standard Form ◽

Sufficient Conditions ◽

Decision Processes ◽

Markov Decision ◽

Standard Models ◽

Reward Functions ◽

Planning Problems ◽

Markov decision processes (MDP) have become one of the standard models for decisiontheoretic planning problems under uncertainty. In its standard form, rewards are assumed to be numerical additive scalars. In this paper, we propose a generalization of this model allowing rewards to be functional. The value of a history is recursively computed by composing the reward functions. We show that several variants of MDPs presented in the literature can be instantiated in this setting. We then identify sufficient conditions on these reward functions for dynamic programming to be valid. We also discuss the infinite horizon case and the case where a maximum operator does not exist. In order to show the potential of our framework, we conclude the paper by presenting several illustrative examples.

Download Full-text

Constrained Continuous-Time Markov Decision Processes on the Finite Horizon

Applied Mathematics & Optimization ◽

10.1007/s00245-016-9352-6 ◽

2016 ◽

Vol 75 (2) ◽

pp. 317-341 ◽

Author(s):

Xianping Guo ◽

Yonghui Huang ◽

Yi Zhang

Keyword(s):

Markov Decision Processes ◽

Continuous Time ◽

Decision Processes ◽

Finite Horizon ◽

Markov Decision

Download Full-text

Constrained optimality for finite horizon semi-Markov decision processes in Polish spaces

Operations Research Letters ◽

10.1016/j.orl.2013.12.009 ◽

2014 ◽

Vol 42 (2) ◽

pp. 123-129 ◽

Author(s):

Yonghui Huang ◽

Zhongfei Li ◽

Xianping Guo

Keyword(s):

Markov Decision Processes ◽

Decision Processes ◽

Finite Horizon ◽

Polish Spaces ◽

Markov Decision

Download Full-text